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摘 要 新 世纪 前 20 年 ， 国 内 结构 方程 模型 (SEM) 方 法 研究 主要 涉及 5 个 主题 : 模型 发 展 、 参 数 估计 、 模 型 
评价 、 测 量 不 变性 及 特殊 数据 处 理 ， 特 别 是 模型 发 展 方面 ( 即 SEM 的 各 种 变 式 ) 有 较 多 成 果 。 对 每 个 主题 ， 在 
简 述 背景 知识 的 基础 上 ， 系 统 总 结 了 方法 学 研究 发 展 及 成 果 。 最 后 也 讨论 了 SEM 的 国外 方法 学 研究 进展 和 未 
关键 词 ”结构 方程 模型 ， 模 型 发 展 ， 参 数 估计 ， 模 型 评价 , 测量 不 变性 
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1 引言 2020 年 ,关键 词 包括 : 结构 方程 、 潜 变量 、 隐 变 
量 、 结 构 模 型 、 测 量 模型 、 验 证 性 因子 分 析 、 验 
证 性 因素 分 析 、 线 性 结构 关系 、 协 方差 结构 、 协 
方差 矩阵 ， 经 筛 查 得 到 期 刊 发 表 的 SEM 论文 192 
篇 , 所 属 学 科 和 发 表 年 份 见 表 1。 不 计 SEM 入 门 
知识 及 学 科 应 用 现状 的 文章 ， 也 不 计 以 应 用 为 主 
BY SCR 
MAB RA, Bik 13 个 学 科 发 表 过 SEM 方 
法 研究 ， 其 中 心理 学 发 文 最 多 ， 其 次 是 医学 和 统 
计 学 。 从 出 版 时 间 来 看 , 2001~2005 年 18 篇 , 2006~ 
(1993) 对 SEM 的 评介 文章 。 侯 杰 泰 等 (2004) 出 版 “00 AFO Ee OSE OF PA 
国内 第 一 本 SEM 专著 大 大 推动 了 SEM 在 国内 的 56 fio SEM 方法 学 研究 总 体 上 呈 上 升 趋势 ， 
传播 和 应 用 。 2011~2015 年 是 高 峰 期 。 这 与 国内 心理 统计 方法 
新 世纪 以 来 国内 SEM 方法 学 研究 取得 长 足 PERRERA S, 2021)。 
进展 ,成果 甚 丰 。 以 中 国 知 网 (https://www.cnki. 根据 内 容 所 涉及 的 SEM 研究 主题 对 文章 进 
net) 全 文 数据 库 为 数据 源 ， 出 版 年 限 设 为 2001~ IA. A 10 逢 以 上 文章 讨论 同一 主题 的 归 为 一 
类 ,否则 归 为 “其 它 ” 类 。 we, 国内 (期 刊 ) 的 SEM 
mam 方法 学 研究 论文 可 以 分 为 5 个 主题 : 模型 发 展 (69 
i HH: 2021-12-28 Aa x TENA -= 
* 国家 自然 科学 基金 项 目 (32171091)、 广 东 省 哲学 社会 ~ mae mh seas a A Mi 
科学 规划 项 目 (青年 项 目 ) (GD21YXL04)、 国 家 社会 科 。。 变性 (15 篇 )、 特 殊 数据 处 理 (10 篇 ), 还 有 其 它 43 
学 基金 项 目 (17BTJ035, 19BMZ080) 、 甘肃 省 教育 科学 ”篇 。 这 与 温 忠 膀 等 (2021) 对 SEM 研究 主题 的 分 类 
规划 项 目 (GS[2021]GHB1777)、 广 东 省 普通 高 校 创新 略 有 出 人 ， 因 为 本 文 不 限于 心理 学 期 刊 发 表 的 论 
团队 项 目 (人 文 社 科 ) (2019WCXTD005)、 广 东 省 教育 文 。 本 文 总 结 新 世纪 20 年 (2001~2020 年 ) 国 内 ( 
科学 规划 项 目 (2020GXJK342) 和 中 央 高 校 基本 科研 业 。。 刊 ) SEM 方法 研究 进展 ， 并 通过 对 比 近 年 来 国外 


务 费 专项 资金 项 目 (31920210120) 资 助 。 yE TIE 、 aye 
通信 作者 : Yat A IE, E-mail: wenzl@scnu.edu.cn SEM 方法 研究 ， 了 解 该 领域 一 些 前 沿 论题 。 


结构 方程 模型 (structural equation model, SEM) 
是 回归 模型 的 推广 有 回归 模型 不 具备 的 诸多 优 
势 : 可 以 同时 处 理 多 个 自 变 量 和 因 变 量 , 满足 社 
科研 究 中 理论 模型 日 益 复杂 化 的 需求 ; 可 以 同时 
分 析 显 变量 和 潜 变 量 , 符合 社 科研 究 中 变量 普遍 
具有 内 隐 性 的 特点 ; 允许 自 变 量 有 测量 误差 , 参 
数 估计 精度 更 高 ; 具有 丰富 的 拟 合 评价 指标 来 评 
价 模型 等 , 这些 优势 使 SEM 成 为 社 科 研究 中 重要 
的 统计 方法 。 国 内 SEM 方法 研究 最 早 见 于 张建平 
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R1 2001~2020 年 国内 (期 刊 ) 各 学 科 发 表 SEM 方法 论文 的 频数 分 布 ( 按 发 文 篇 数 排序 ) 
年 份 
刊物 类 别 合计 
2001~2005 2006~2010 2011~2015 2016~2020 
心理 学 5 12 28 25 70 
医学 2 12 14 12 40 
统计 学 5 13 12 3 33 
ESE 2 8 11 10 31 
综合 性 刊物 4 5 3 6 18 
= a HD 


TE: 其 它 学 科 包 括 系 统 科学 (7 篇 )、 


管理 学 (6 篇 ) 、 数 学 (4 篇 )、 体 育 学 (3 篇 )、 信 息 学 (3 篇 )、 教 育 学 (3 篇 )、 社 会 学 (2 篇 )、 


生物 学 (1 篇 )、 计 算 机 科学 (1 篇 ) 和 语言 学 (1 篇 )。 综 合 性 刊物 主要 是 高 校 学 报 。 表 中 涉及 基于 SEM 的 信 度 计算 和 中 介 调 节 
方法 论文 29 篇 , 由 于 这 些 文章 另 有 专文 综述 ( 见 : 方 杰 等 , 2022; WER, WRI 4,2022; WER, 方 杰 等 , 2022)， 这 里 


只 做 篇 数 统计 ， 正 文 未 出 现 。 


2 结构 方程 模型 的 发 展 


结构 方程 模型 包含 测量 模型 measurement 
model) 和 结构 模型 (structural model)。 测 量 模 型 反 
映 潜 变 量 及 其 测量 指标 的 关系 , 单独 使 用 即 为 验 
证 性 因子 分 析 (confirmatory factor analysis, CFA); 
结构 模型 反映 ( 潜 ) 变 量 间 的 影响 关系 ， 如 果 结 构 
模型 中 的 潜 变 量 换 成 测量 指标 的 均 分 或 总 分 进行 
分 析 ， 就 是 路 径 分 析 (path analysis)。 近 年 来 , SEM 
发 展 出 不 少 新 变 式 , 测量 模型 方面 主要 有 双 因 子 
模型 、 探 索性 结构 方程 模型 、 特 殊 设 计 的 测量 模 
型 (随机 稚 距 因子 分 析 模 型 、 预 设 路 径 模型 及 瑟 斯 
顿 模型 ) 和 形成 性 测量 模型 ; 而 结构 模型 方面 主要 
是 主客 体 互 依 模型 ; 全 模型 方面 ( 即 同时 包含 测量 
和 结构 模型 的 完整 SEM) 主 要 是 测量 指标 合并 ( 即 
条 目 打 包 ) 的 SEM。 此外, SEM 在 群体 异 质 性 研究 
和 追踪 研究 中 的 发 展 也 值得 关注 。 
2.1 测量 模型 的 发 展 
211 双 因 子 模型 

传统 CFA 中 ,一 个 问卷 条 目 只 在 一 个 因子 上 


型 , 但 只 有 满足 比例 约束 ( 即 每 个 维度 中 全 局 因子 
载荷 和 局 部 因子 载荷 之 比 为 常数 ) 的 双 因 子 模型 
才能 转换 为 一 个 高 阶 因子 模型 ( 顾 红 街 等 ， 
2014)。 模 拟 研究 发 现 ， 对 于 满足 比例 约束 的 特殊 
双 因 子 模型 ， 其 对 潜 效 标 变 量 的 预测 精度 不 如 高 
阶 因 子 模型 ( 徐 霜 雪 等 ,2017); 而 在 不 满足 比例 
约束 的 更 一 般 情况 下 ,使 用 双 因 子 模型 进行 预测 
效 度 分 析 时 ， 模 型 拟 合 、 统 计 检 验 力 和 效 度 系数 
估计 精度 优 于 高 阶 因子 模型 ( 温 忠 腾 等 , 2019)。 
2.1.2 ”探索 性 结构 方程 模型 
传统 CFA 模型 是 典型 的 独立 分 群 模型 ， 问 卷 
条 目 在 非 目 标 因 子 上 载荷 固定 为 0， 这 可 能 造成 
因子 问 相关 虚 高 , 也 容易 使 CFA 拟 合 不 了 探索 性 
因子 分 析 得 到 的 因子 结构 。 探 索性 结构 方程 模型 
(exploratory structural equation model, ESEM) 可 以 
有 效 弥 补 这 些 局 限 。ESEM 在 CFA 的 基础 上 , 允 
许 跨 因子 载荷 不 为 0。 更 真实 地 体现 因子 结构 的 
同时 , 还 容易 获得 较 好 的 拟 合 。 麦 玉 娇 和 温 忠 甩 
(2013) 详 细 介 绍 了 ESEM 的 原理 ,比较 了 ESEM 
和 探索 性 因子 分 析 、CFA 的 异同 点 ， 并 给 出 了 使 


有 非 零 载荷 。 双 因子 模型 (bi-factor model) 则 在 传 
统 多 因子 CFA 模型 基础 上 ， 人 允许 问卷 条 目 额 外 负 
载 于 一 个 全 局 因子 ( 顾 红 大 等 ， 2014), 全 局 因子 
可 以 是 特质 因子 (可 用 于 探索 和 验证 高 阶 因子 结 
构 、 计 算 基 于 CFA 模型 的 信和 度 及 分 析 各 类 因子 与 
效 标 变 量 的 关系 ) 或 方法 因子 (可 用 于 检验 共同 方 
法 偏差 )。 

双 因 子 模型 和 高 阶 因 子 模型 有 艇 套 关 系 ,， 任 
何 一 个 高 阶 因子 模型 都 可 以 转换 为 一 个 双 因 子 模 


用 ESEM 的 建议 。 值 得 一 提 的 是 ， 如 果 模 型 参数 
估计 采用 贝 叶 斯 法 并 设 定 特殊 先 验 ， 则 不 仅 能 像 
ESEM 一 样 放宽 蜂 因 子 载荷 限制 ， 还 能 更 灵活 地 
放宽 残 差 相关 限制 (Muthén & Asparouhov, 2012)。 
2.1.3 ”特殊 设计 的 测量 模型 

随机 截 距 因 子 分 析 模 型 。 随 机 截 距 因子 分 析 
模型 random intercept factor analysis model) 在 一 
fit CFA 模型 的 基础 上 , 增加 一 个 洪 截 距 因 子 。 洪 
截 距 因 子 取 值 在 被 试 间 有 变异 ,在 条 目 间 无 变异 
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( 即 潜 截 距 因子 在 所 有 条 目 上 载荷 固定 为 常数 )， 
以 此 反映 被 试 的 某 种 稳定 特质 (如 社会 赞许 性 或 
默许 偏差 )， 可 以 用 于 解释 和 控制 条 目 表 述 效 应 。 
研究 发 现 ， 相 比 于 双 因 子 模型 ， 随 机 截 距 因 子 分 
析 模 型 有 助 于 提升 特质 变异 在 问卷 分 数 总 变异 中 
的 占 比 , 使 问卷 在 存在 条 目 表述 效应 的 条 件 下 具 
备 更 好 的 结构 效 度 ,特质 变异 大 于 方法 变异 ( 韦 嘉 
等 , 2016)。 

预 设 路 径 模 型 。 预 设 路 径 模型 (fixed-links 
model) 专 门 用 于 实验 研究 ， 主 要 作用 是 分 离 实 验 
中 的 目标 因子 和 无 关 因 子 , 令 实 验 目标 概念 的 测 
量 更 准确 。 潜 变量 由 1 个 目标 因子 和 若干 个 非 目 
标 因 子 构 成 。 因 子 载荷 固定 ， 且 允许 跨 因 子 载荷 。 
目标 因子 载荷 根据 已 有 理论 知识 和 经 验 指定 ， 
非 目标 因子 载荷 统一 设 定 为 一 个 常数 。 模 型 的 记 
价 除 了 拟 合 指数 ， 还 依赖 目标 因子 方差 。 目 标 
子 方差 显著 表示 该 潜 变 量 所 代表 的 心理 过 程 是 
成 任务 所 必须 的 ( 任 学 柱 等 , 2017)。 
瑟 斯 顿 模型 。 社 科研 究 中 常见 到 配对 比较 任 
务 和 排序 任务 。 配 对 比较 任务 如 : 在 配对 呈现 的 
两 个 面孔 图 片 中 选择 更 喜欢 的 一 个 ; 而 排序 任务 
如 : 将 3 个 面孔 图 片 按 喜 好 程度 排序 。 任 务 产生 
的 数据 为 等 级 数据 ,不 满足 经 典 测量 理论 的 基本 
假设 ( 王 珊 等 ,2014)， 最 好 用 专门 的 模型 分 析 ， 
比如 瑟 斯 顿 模 型 (Thurstone model). 该 模型 中 潜 变 
量 表示 比较 或 排序 任务 中 的 某 个 选项 ， 而 潜 变 量 
所 属 测量 指标 为 被 试 对 该 选项 与 其 它 选 项 的 偏好 
选择 结果 。 者 被 试 偏好 当前 选项 ， 则 因子 载荷 固 
定 为 1， 和 否则 为 -1。 对 于 排序 任务 ,测量 指标 的 残 
差 设 定 为 0。 这 种 模型 的 优势 在 于 ， 可 以 同时 得 到 
各 任务 选项 均值 差异 的 详细 信息 及 被 试 的 个 体 差 
异 信息 ; 能 侦 测 到 细小 的 选项 差异 ; 可 以 避免 社 
会 赞许 性 的 影响 ( 宋 晓 娟 ， 刘 红云 , 2016)。 

2.14 ”形成 性 测量 模型 

形成 性 测量 模型 (formative measurement 
model, FM) 是 测量 模型 的 一 种 特殊 形式 。 FM 与 传 
统 的 测量 模型 (也 可 称 为 反映 性 模型 ; reflective 
measurement model, RM) 的 主要 区 别 体现 在 ( 贾 跃 
F, ET, 2009): (1) RM 中 因子 影响 测量 指标 ; 
FM 则 相反 ,因子 由 测量 指标 所 构建 ; (2) RM 要 求 
测量 指标 具有 高 内 部 一 致 性 ， 可 以 互 换 ; FM 测量 
指标 可 以 不 相关 甚至 负 相 关 ， 编 制 测 量 指标 更 要 
紧 的 是 涵盖 构 念 的 所 有 方面 , RM 的 信 效 度 及 拟 合 


= 


w 


at W 


= 


评价 指标 往往 不 适用 于 FM; (3) RM 的 误差 项 体现 
在 测量 指标 层次 ; FM 的 误差 项 体现 在 潜 变 量 层次 ; 
(4) RM 适用 于 验证 性 的 研究 ,注重 理论 模型 与 实 
际 数据 的 拟 合 及 参数 估计 的 准确 性 ; 而 FM 适用 
于 探索 性 的 研究 ， 更 关注 测量 指标 对 潜 变 量 的 预 
测 效 力 。 

虽然 FM 并 未 如 RM 一 样 流行 (页 跃 千 ， 宝 贡 
敏 ，2009), 但 在 国内 也 受到 一 定 关 注 ， 有 一 些 研 
究 介 绍 该 模型 的 基本 原理 和 特征 ( 王 念 新 等 ， 
2013; 王 晓 丽 等 , 2011; 叶 浩 生 ， 李 明 , 2014). € 
念 新 等 (2011) 的 模拟 研究 表明 ， 如 果 将 FM 误 设 为 
RM 可 能 造成 路 径 系 数 的 估计 偏差 和 两 类 错误 率 
的 升 高 ， 建 议 利 用 模型 细 化 法 和 模型 分 解法 来 避 
免 模 型 误 设 。 
2.2 ”结构 模型 的 发 展 

社 科研 究 常常 关注 成 对 数据 (dyadic data)， 如 
配偶 双方 、 师 生 双 方 及 上 下 级 双方 等 在 同一 变量 
上 的 数据 。 此 类 数据 往往 不 具备 独立 性 ( 李 育 辉 ， 
黄 飞 , 2010)。 为 避免 可 能 的 两 类 错误 膨胀 ， 需 要 专 
门 的 统计 方法 。 主 客体 互 依 模型 (actor-partner 
interdependence model，APIM) 是 一 种 专门 分 析 成 
对 变量 关系 的 结构 模型 。 以 教师 和 学 生 的 共 情 能 
力 ( 自 变量 ) 对 教师 和 学 生 的 领悟 社会 支持 ( 因 变 量 ) 
的 影响 为 例 ， 主 客体 互 依 模型 具体 路 径 设 定 包 括 
4 个 部 分 : (1) 学 生 / 教 师 共 情 对 其 自身 领悟 社会 支 
持 的 影响 ， 即 主体 效应 ; (2) 学 生 / 教 师 共 情 对 对 方 
的 领悟 社会 支持 的 影响 ， 即 客体 效应 ; (3) 学 生 和 
教师 共 情 的 相关 ， 这 一 设 定 可 以 在 分 析 某 一 自 变 
量 的 效应 时 ,控制 男 一 自 变量 的 影响 ; (4) 学 生 和 
教师 的 因 变量 残 差 相关 ， 用 于 控制 除 自 变 量 之 外 
的 其 它 因 变量 互 依 性 来 源 (刘畅 ,， 伍 新 春 ,，2017)。 
通过 APIM 可 以 分 析 主 体 效 应 和 客体 效应 的 大 小 
和 方向 特点 及 何者 更 占 优势 。APIM 具体 的 原理 
( 李 育 辉 ， 黄 飞 ，2010)、 分 析 流 程 (刘畅 , 伍 新 春 ， 
2017)、 模 型 变 式 (如 含 中 介 和 调节 变量 的 APIM; 
陈 莎 等 , 2020; 刘畅 , 伍 新 春 ，2017) 及 软件 操作 
(如 Mplus 和 SPSS; 陈 莎 等 , 2020; 何 娟 等 , 2018) 
可 参考 相关 方法 文献 。 
2.3 ”全 模型 的 发 展 

条 目 打 包 (item parceling) 可 以 视 为 全 模型 构 
建 的 一 种 特殊 方法 。 这 种 方法 将 测验 原始 条 目 聚 
合成 条 目 包 ,牺牲 了 测量 模型 分 析 的 可 靠 性 ， 但 
能 改善 结构 模型 的 参数 估计 和 模型 拟 合 。 国 内 关 
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于 条 目 打 包 的 研究 涉及 两 个 方面 , 一 是 对 打包 技 
术 及 策略 的 介绍 和 演示 。 如 卞 冉 等 (2007) 详 细 介绍 
了 条 目 打 包 的 基本 逻辑 、 优 劣势 及 具体 方法 。 而 
吴 艳 和 温 忠 迄 (2011) 在 此 基础 上 进一步 细 化 了 打 
包 方 法 并 给 出 了 操作 流程 。 对 于 单 维 量 表 ， 前 一 
组 研究 者 从 经 济 实用 的 角度 出 发 ， 推荐 随机 法 打 
包 ( 即 条 目 打 包 不 依循 任何 规律 FF 等 ,2007); 


第 二 是 对 包含 协 变量 的 LCM/LPM 或 潜 类 别 
与 协 变 量 关 系 分 析 的 人 研究， 如 王 孟 成 和 毕 向 阳 
(2018) 总 结 了 含 协 变量 的 LCM ( 即 回归 混合 模型 ) 
的 分 析 方 法 并 给 出 了 Mplus 语句 模板 。 学 界 一 般 
推荐 用 LTB 法 (Lanza et al., 2013) 处 理 分 类 结果 变 
量 , 用 BCH 法 (Bolck et al., 2004) 或 稳健 三 步 法 处 
理 连 续 结果 变量 , 后 者 也 适用 于 协 变量 是 预测 变 


后 一 组 研究 者 从 拟 合 提 升 最 大 的 角度 出 发 ， 推 荐 
平衡 法 ( 即 首 先 将 条 目 按 因子 载荷 高 低 排 序 ， 再 按 
照 “S" 形 顺序 分 配 各 包 条 目的 方法 ; 吴 艳 , TE AB, 
2011); 对 于 多 维 量 表 ， 两 组 研究 者 都 建议 采用 内 
部 一 致 性 法 ( 即 每 个 维度 内 所 有 条 目 聚 合成 一 个 
条 目 包 ; KH 等 , 2007; WH, VERE, 2011), Al 
为 该 法 保留 了 潜 变 量 的 多 维 结构 。 王 若 宾 等 (2014) 
建议 对 全 模型 中 的 多 维 量 表 按 维度 均 分 打包 ， 并 
通过 实例 演示 说 明 该 方法 可 以 简化 模型 ， 提升 对 
路 径 系数 的 检验 力 ， 并 获得 理想 拟 合 。 第 二 个 方 
面 是 条 目 打包 和 其 它 模型 形式 的 比较 ， 如 杨 彤 双 
等 (2010) 用 一 个 应 用 实例 比较 了 条 目 打包 路径 分 


量 的 情形 ( 王 孟 成 ， 毕 向 阳 , 2018)。 张 洁 婷 等 (2017) 
介绍 了 LPM 后 续 分 析 ( 即 分 出 潜 类 别 后 ,探究 潜 
类 别 与 前 因 后 果 变 量 关系 的 分 析 ) 的 方法 ， 并 通过 
模拟 研究 比较 指出 , 纳入 式 分 类 分 析 法 ( 即 潜 剖 面 
分 类 时 就 将 后 续 分 析 需 要 的 变量 作为 协 变量 纳入 
模型 ) 的 后 续 分 析 参 数 估计 效果 比较 好 ， 兼 有 准确 
性 和 稳健 性 。 进 一 步 研 究 则 发 现 ， 当 纳入 的 后 续 
分 析 变 量 包含 结果 变量 及 自 变 量 与 潜 类 别 变量 的 
乘积 项 时 ,后续 参数 估计 效果 比较 好 。 更 具体 的 
分 析 流 程 见 张 洁 婷 等 (2019)。 

第 三 是 通过 模拟 研究 考察 LCM/LPM 的 分 类 
效果 , 包括 LCM/LPM 与 其 它 个 体 中心 方 法 的 比 


析 及 未 打包 的 全 模型 ,结果 发 现 条 目 打包 的 模型 
拟 合 指数 比较 好 ， 而 未 打包 全 模型 所 得 的 测定 系 
数 及 要 高 于 条 目 打 包 和 路 径 分 析 。 
2.4 群体 异 质 性 研究 中 的 结构 方程 模型 

探究 不 可 直接 观测 的 群体 异 质 性 是 很 多 研究 
的 兴趣 所 在 ,由 此 催生 了 大 量 基 于 SEM 的 异 质 性 
分 析 方 法 。 刘 源 和 刘 红 云 (2015) 及 李 丽 乱 等 (2015) 
对 此 类 方法 进行 了 总 结 ， 主 要 包括 : A 
模型 、 因 子 混合 模型 和 多 水 平 潜 类 别 模 型 。 
2.4.1 ” 潜 类 别 / 潜 剖面 模型 

潜 类 别 / 江 训 面 模型 是 根据 外 显 测量 指标 对 
被 试 进行 分 类 的 测量 模型 ( 张 洁 婷 等 , 2010)， 是 
聚 类 分 析 思 想 在 SEM 中 的 体现 。 若 测量 指标 是 类 
别 变量 ， 则 为 潜 类 别 模型 (latent class model, 
LCM); 若是 连续 变量 ， 则 为 淤 剖面 模型 (latent 
profile model, LPM). 
国内 关于 LCM/LPM 的 研究 涉及 三 个 方面 。 
第 一 是 对 LCM/LPM 基本 原理 和 分 析 流 程 的 介 
绍 。 如 张 洁 婷 等 (2010) 介 绍 了 LCM 的 统计 原理 、 
分 析 过 程 及 在 心理 学 研究 中 的 应 用 情况 。 郭 小 玲 
等 (2009)、 重 灿 等 (2010) 及 曾 完 华 等 (2013) 分 别 用 
模拟 研究 数据 和 应 用 案例 演示 了 LCM 的 分 析 流 
程 。 尹 奎 等 (2020) 介 绍 了 LPM 的 基本 原理 、 步 又 
及 在 组 织 行为 研究 中 的 应 用 。 


较 及 不 同 数据 和 模型 条 件 对 分 类 结果 的 影响 。 如 
马 文 超 等 (2014) 通 过 模拟 比较 发 现 , 除 只 有 两 个 
湾 类 别 且 各 类 样本 容量 极端 不 均衡 的 特殊 情况 外 ， 
LCM 和 快速 聚 类 法 及 混合 Rasch 模型 的 分 类 精度 
相当 。 赵 丽 等 (2013) 通 过 模拟 比较 指出 LPM 的 分 
类 准确 率 高 于 系统 聚 类 法 。 王 孟 成 、 邓 俏 文 、 毕 
向 阳 等 (2017) 通 过 模拟 研究 考察 了 LPM 中 类 别 
数 、 类 间距 、 样 本 容量 和 测量 指标 个 数 对 Entropy 
分 类 精确 性 的 影响 。 
2.4.2 ”因子 混合 模型 
因子 混合 模型 (factor mixture model) 将 CFA 
All LCM 整合 在 同一 个 模型 中 ,可 以 看 作 是 一 种 以 
CFA 中 潜 变 量 为 分 类 指标 的 LCM; 也 可 以 看 作 是 
考虑 了 群体 异 质 性 的 CFA 模型 。 陈 宇 帅 等 (2015) 
介绍 了 因子 混合 模型 的 基本 原理 、 主 要 优势 、 应 
用 方向 及 分 析 步 又 。 李 观 海 等 (2020) 比 较 了 不 同样 
本 量 和 因子 间 相 关 条 件 下 潜 类 别 因 子 模型 (因子 
混合 模型 变 式 之 一 , 假定 群体 异 质 性 仅 存 在 于 潜 
均值 ) 和 LCM 的 表现 , 结果 显示 前 者 的 模型 拟 合 
及 分 类 效果 都 好 于 后 者 ， 且 模型 更 精简 和 易于 
识别 。 
2.4.3 ”多 水 平 潜 类 别 模型 

多 水 平 LCM 是 专门 针对 多 水 平 结构 数据 的 
LCM， 可 以 针对 相同 的 测量 指标 在 个 体 ( 层 1) 和 
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组 织 ( 层 2) 层 级 分 别 进行 分 类 。 张 洁 婷 等 2013) 介 
绍 了 多 水 平 潜 类 别 模型 的 基本 原理 ， 以 小 学 英语 
能 力 测验 为 例 演 示 了 多 水 平 LCM 的 分 析 步 又 ,并 
比较 了 多 水 平 LCM 与 一 般 LCM 的 效果 差异 。 
25 追踪 研究 中 的 结构 方程 模型 

追踪 研究 是 一 种 通过 对 相同 的 研究 对 象 和 变 
重复 测量 多 次 ， 对 序列 数据 进行 处 理 、 分析， 以 
了 解 变量 发 展 趋势 、 变 量 之 间 相 互 关系 及 个 体 差 
异 的 研究 设计 ,国内 追踪 研究 中 的 SEM 方法 主要 
涉及 描述 发 展 趋 势 及 差异 的 模型 ( 潜 增 长 模型 、 多 
阶段 增长 模型 、 潜 类 别 增长 模型 、 增 长 混合 模型 、 
多 阶段 增长 混合 模型 和 潜在 转变 模型 ) 及 探究 变 
量 间 相 互 影 响 的 模型 (交叉 滞后 模型 )。 
25.1 ”描述 发 展 趋势 及 差异 的 模型 

潜 增长 模型 。 潜 增长 模型 (latent growth model, 
LGM) 以 不 同时 间 点 的 变量 观测 值 作为 测量 指标 ， 
用 一 个 截 距 因子 反映 被 试 的 特质 基线 水 平 (因子 
载荷 固定 为 1)， 者 干 斜 率 因子 反映 特质 的 线性 或 
非 线 性 变化 趋势 。 可 同时 用 于 探究 心理 特质 的 个 
体 差 异 与 发 展 趋势 .已 有 不 少 方法 文献 介绍 LGM 
的 基本 原理 、 常 见 变 式 、 软 件 操作 (如 Mplus 和 
SAS) 及 优 缺 点 等 ( 李 丽 霞 等 , 2012; 宋 秋月 , E 
舟 ，2017; IRE, RV, 2017; FES F, 
2007)。 李 丽 霞 等 (2014) 从 模型 数学 形式 、 前 提 假 
设 、 数 据 格式 、 参 数 估计 及 建 模 的 灵活 性 与 复杂 
性 等 角度 比较 了 LGM 和 多 水 平 模型 ,指出 多 水 
平 建 模 更 加 简单 直接 ; 而 LGM 更 加 灵活 ， 可 以 放 
松 对 测量 误差 相等 的 限制 ， 自 由 估计 每 次 测量 误 
2, 参数 佑 计 精 度 更 好 。 

多 阶段 增长 模型 。LGM 假定 个 体 的 发 展 轨迹 
总 是 连续 的 ， 忽 视 发 展 可 能 存在 的 阶段 性 与 转折 
点 (如 前 期 增长 慢 而 后 期 增长 快 )。 多 阶段 增长 模型 
(piecewise growth models，PGM) 人 允许 增长 曲线 有 
不 同 发 展 阶段 。 刘 源 等 (2013) 通 过 模拟 研究 探讨 了 
SEM 和 多 水 平 模型 框架 下 定义 的 PGM 的 参数 佑 
计 效 果 差 异 及 将 PGM 错误 设 定 为 无 阶段 模型 的 
后 果 。 

潜 类 别 增长 模型 和 增长 混合 模型 。LGM 假设 
潜 变 量 在 个 体 间 的 发 展 轨迹 相同 , 忽视 了 可 能 存 
在 的 异 质 性 。 潜 类 别 增长 模型 (latent class growth 
model，LCGM) 和 增长 混合 模型 (growth mixture 
model，GMM) 通 过 结合 LCM 和 LGM, 可 以 将 个 
体 按照 特质 发 展 趋势 的 不 同 进行 分 类 ,前 者 假定 


rel 


同一 类 别 内 个 体 无 差异 ,， Ja PF TC BAR ill (25 m E 
等 , 2015), 前 者 可 视 为 后 者 特例 ( 王 孟 成 等 , 2014; 
肖 健 等 , 2020)。 有 关 LCGM 的 详细 介绍 参见 吕 
温 尘 和 赵 然 (2018) 或 王 重 成 等 2014); AK GMM 
的 详细 介绍 参见 刘 红 云 (2007)、 王 孟 成 等 (2014)、 

肖 健 等 (2020) 或 喻 嘉宏 等 (2018)。 

多 阶段 增长 混合 模型 。 多 阶段 增长 混合 模型 
(piecewise growth mixture model, PGMM) 是 PGM 
和 GMM 的 结合 ， 人 允许 发 展 轨迹 既 分 阶段 ， 又 有 
群体 异 质 性 。 王 婧 等 (2017) 详 细 描 述 了 PGMM 的 
基本 原理 、 常 见 模型 形式 、 参 数 估计 方法 及 影响 
因素 、 样 本 量 需求 、 拟 合 评价 指标 、 应 用 现状 及 
未 来 研究 方向 。 刘 源 等 2014) 则 利用 模拟 研究 考察 
了 潜 类 别 间 距 和 发 展 模型 形态 对 PGMM 的 模型 
选择 及 参数 估计 的 影响 。 

潜在 转变 模型 ,潜在 转变 模型 (latent transition 
model, LTM) 是 LCM 在 追踪 研究 中 的 推广 , 不 仅 
可 以 探究 各 时 间 点 可 能 存在 的 潜 类 别 ， 允许 潜 类 
别 发 生变 化 ,还 可 以 考察 个 体 从 某 一 类 别 转变 为 
其 它 类 别 的 概率 。 王 尊 琢 等 (2015) 和 黄 明明 (2019) 
介绍 了 LTM 的 统计 原理 ， 并 分 别 以 青少年 冲动 行 
为 和 英语 阅读 理解 测验 为 例 ， 演示 了 LTM 的 分 析 
过 程 和 结果 解读 。 黄 明明 (2018) 介 绍 了 基于 混合 项 
目 反 应 理论 的 LTM 的 理论 基础 、 转 变 机 制 、 模 型 
特性 、 应 用 现状 及 发 展 前 景 。 

2.5.2 ”探究 变量 间 相 互 影响 的 模型 

AO SC hit Jar Bt HE (cross-lagged model) 通 过 分 析 
多 变量 间 跨 时 间 的 相互 影响 ,可 以 探索 变量 间 谁 
是 因 谁 是 果 。 模 型 重点 关注 的 效应 包括 ( 刘 源 等 ， 
2022): (1) 自 回归 效应 ， 即 同一 变量 前 测 对 后 测 的 
影响 ,反映 变量 的 跨 时 间 稳 定性 ( 重 测 信 度 ); (2) 交 
叉 滞 后 效应 ， 即 控制 变量 B 前 测 时 变量 A 前 测 对 
变量 了 后 测 的 效应 和 控制 变量 A 前 测 时 变量 B 前 
测 对 变量 A 后 测 的 效应 。A 和 B 的 因果 顺序 判断 
依据 是 前 测 原因 变量 对 后 测 结果 变量 的 预测 作用 
(以 标准 化 路 径 系 数 表示 ) 应 明显 高 于 前 测 结 果 变 
量 对 后 测 原 因 变 量 的 预测 作用 ( 周 广 帅 等 ， 
2020)。 该 方法 可 以 使 问卷 研究 更 好 地 满足 因果 推 
论 对 于 因果 先后 顺序 及 无 关 变量 控制 的 要 求 ( 温 
ERB, 2017). 


3 ”结构 方程 模型 参数 估计 方法 
SEM 的 参数 估计 基于 对 协 方差 结构 的 分 析 。 
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设 (9) 和 S 分 别 为 根据 理论 模型 得 出 的 协 方差 矩 
阵 和 样本 协 方差 矩阵 , 9 为 参数 向 量 。 用 拟 合 函 数 
FIS, (9)] 表 示 2(9) 与 S 的 距离 。 参 数 估计 的 过 程 
即 求 得 使 FIS, (9)] 达 到 最 小 值 的 8 估计 值 的 过 
程 。 不 同 拟 合 函数 构建 方式 产生 了 不 同 的 参数 佑 
计 方 法 。 使 用 最 多 的 方法 是 极 大 似 然 估计 
(maximum likelihood estimate, ML)。 当 数据 非 正 
AS, 通常 使 用 稳健 极 大 似 然 佑 计 (robust maximum 
likelihood estimate，MLR) 或 均值 和 方差 校正 的 加 
权 最 小 二 乘 估计 (weighted least squares with mean 
and variance adjusted, WLSMV)。 前 者 对 因子 间 相 
关 及 参数 标准 误 的 估计 更 准确 , 后 者 对 因子 载荷 
的 估计 更 准确 (Li，2016)， 且 更 适合 计 分 点 数 偏 少 
的 数据 。 
内 有 关 SEM 参数 估计 方法 的 研究 ， 主 要 涉 
及 两 个 方面 : 一 是 方法 的 介绍 ,主要 包括 偏 最 小 
二 乘法 (partial least square, PLS) FI D! it Hr y% 
(Bayesian methods); 二 是 参数 估计 方法 的 比较 。 
31 偏 最 小 二 乘法 

传统 参数 估计 方法 求解 SEM 是 令 拟 合 函数 
最 小 化 的 过 程 ， 强 调 参数 估计 精度 ; 而 PLS 求解 
SEM 则 是 令 残 差 方差 最 小 化 的 过 程 ， 强 调 方程 中 
预测 变量 对 结果 变量 的 预测 精度 ， 这 一 特点 与 形 
成 性 建 模 的 主要 目的 (追求 测量 指标 对 因子 的 解 
释 能 力 最 大 化 ) 非 常 契合 ( 王 念 新 等 , 2013)， 因 此 
PLS 和 常常 被 用 于 分 析 形 成 性 模型 ， 通 常 使 用 专用 
软件 如 SmartPLS .semPLS 或 WarpPLS 进行 分 析 。 
相 比 于 传统 参数 估计 方法 , PLS 的 优势 主要 在 于 : 
(1) 更 适合 小 样本 和 非 正 态 数据 ; (2) 适 合 复杂 模型 


林 盛 等 (2006) 介 绍 了 两 个 潜 变 量 的 PLS 算法 如 何 
扩展 到 适用 于 多 个 潜 变 量 。 程 豪 和 易 丹 辉 (2016) 
介绍 了 用 PLS 估计 二 阶 因子 模型 的 基本 原理 和 优 
点 ; 赵 萍 (2011) 讨 论 了 使 用 PLS 估计 二 阶 因子 模 
型 时 不 同 权 重 估计 算法 模式 的 优 劣 。 王 芝 卑 等 
(2020) 介 绍 了 PLS 路 径 模型 的 分 位 效应 (一 般 的 
SEM 是 用 自 变量 预测 因 变 量 均值 ， 分 位 效应 则 是 
指 用 自 变量 预测 因 变 量 百 分 位 数 ) 估 计 方 法 。 备 洁 
和 王 惠 文 (2009)、 李 顺 勇 和 岳 利 梅 (2017) 分 别 介绍 
了 如 何 将 基于 PLS 的 路 径 分 析 和 基于 PLS 的 SEM 
用 于 处 理 成 分 数据 ( 即 在 O~1 之 间 取 值 、 和 为 1 的 
数据 )。 任 红 梅 和 王 疆 (2010) 介 绍 并 推荐 使 用 模糊 
PLS 来 为 具有 不 确定 性 的 数据 (比如 Likert 量 表 的 
中 间 项 往往 表示 不 确定 ) 进 行 SEM 建 模 。 应 用 实 
例 表明 ,该 方法 的 参数 估计 精确 度 优 于 未 经 模糊 
处 理 的 PLS， 且 模型 拟 合 更 好 。 
3.2 MIETE 

贝 叶 斯 统计 分 析 是 一 种 将 已 有 的 对 于 待 估计 
参数 的 经 验 和 知识 ( 即 先 验 信息 ) 融 入 参数 估计 的 
过 程 。 贝 叶 斯 法 用 于 SEM 时 的 参数 估计 过 程 如 下 : 

(1) 首 先 设 定理 论 模型 这 一 步 和 普通 SEM 
无 异 , (2) 设 定 所 有 未 知 参数 的 先 验 分 布 参数 (也 称 
超 参数 )。 研 究 中 感 兴趣 的 参数 一 般 是 目标 因子 载 
荷 和 路 径 系 数 ,通常 假定 服从 正 态 分 布 ， 需 设 定 
均值 和 方差 两 个 参数 ， 可 参照 已 有 研究 特别 是 元 
DICT, Eike 等 , 2018)。 需要 强调 ， 尽 管 
很 多 软件 能 给 出 默认 先 验 分 布 参数 (无 信息 先 验 ， 
相当 于 仅 采 用 贝 叶 斯 的 估计 框架 ， 但 却 不 利用 先 
验 信 息 ),， 但 贝 叶 斯 法 的 核心 优势 是 利用 先 验 信 ， 


et 


( 即 变量 数 与 样本 容量 之 比较 高 的 模型 ); (3) 适 合 
形成 性 模型 分 析 ; (4) 适 合 对 多 个 预测 变量 的 作用 
进行 探索 的 SEM 研究 ( 骆 雷 , 2020)。 
国内 有 关 PLS 的 介绍 主要 涉及 两 个 方面 , 一 
是 对 PLS 的 介绍 与 评价 ,如 朱 利 平 和 刘 莉 (2005)、 
宁 禄 乔 等 (2007) 详 细 介 绍 了 了 PLS 的 参数 估计 过 程 。 
孙 继 红 和 杨 晓 江 (2009) 总 结 并 讨论 了 基于 PLS 的 
SEM 涉及 的 三 个 重要 问题 : 测量 模型 如 何 选择 、 
如 何 用 bootstrap 法 估计 和 检验 参数 及 如 何 评价 模 
型 。 刘 金兰 等 (2005) 讨 论 了 PLS 算法 的 几何 意义 。 
宁 禄 乔 和 刘 金 兰 (2007) 通 过 模拟 研究 考察 了 PLS 
估计 SEM 参数 的 效果 , 发 现 该 方法 低估 结构 系数 ， 
高 佑 因子 载荷 。 当 样本 容量 较 大 时 ,结果 基本 可 信 。 

第 二 是 PLS 在 特定 模型 及 数据 中 的 拓展 ， 如 


帮助 参数 估计 。 有 研究 发 现 使 用 无 信息 先 验 并 不 
LG ML 强 , 其 至 小 样本 时 基于 无 信息 先 验 的 贝 叶 
斯 估计 还 可 能 造成 严重 不 稳定 和 有 偏 的 估计 结果 
(Smid & Winter, 2020)。 因 此 采用 贝 叶 斯 法 时 ,应 
尽量 使 用 有 信息 先 验 。 

(3) 利 用 马尔 可 夫 链 蒙特 卡 洛 方法 (Markov 
chain Monte Carlo, MCMC) 的 Gibbs 抽样 获取 参数 
后 验 分 布 ( 张 言 彩 , 2009)。 估 计 结 果 是 否 收敛 可 以 
利用 潜在 尺度 缩减 因子 (potential scale reduction), 
ER ib Fl (trace plots) 及 有 效 样 本 容量 (effective 
sample size) 等 判定 (具体 的 解读 方法 参见 : 王 孟 成 ， 
邓 俏 文 ， 毕 向 阳 , 2017 和 Smid & Winter, 2020). 
估计 收敛 后 ,后 验 分 布 的 集中 量 数 (如 均值 或 中 位 
数 ) 可 以 作为 模型 参数 的 点 估计 值 。 同 时 ， 有 了 后 
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验 分 布 , 可 以 获取 基于 贝 叶 斯 法 的 可 信和 区 间 
(credible interval), 

相 较 传统 的 基于 频率 理论 的 SEM 参数 估计 
方法 ， 贝 叶 斯 法 的 主要 优点 是 : (1) 小 样本 条 件 下 
估计 效果 更 好 , 尤其 是 能 够 提供 有 效 先 验 信 息 时 ; 
(2) 计 算 速 度 更 快 ( 王 孟 成 ， 邓 俏 文 ， 毕 向 阳 ，2017); 
(3) 当 模型 复杂 ， 或 待 估计 参数 和 样本 容量 之 比较 
高 时 ,传统 参数 估计 容易 出 现 收敛 问题 ,而 贝 叶 
斯 方法 往往 能 收敛 到 恰当 解 ( 梁 芋 妈 , Hs, 
2016; Ema, XRX, Fe lay BA, 2017); (4) 贝 叶 斯 
方法 受 非 正 态 的 影响 更 小 ( 受 宁 , 李 英 AE, 2018); 
(5) 传 统 方法 不 可 识别 的 模型 (比如 令 所 有 路 因子 


最 小 二 乘法 (weighted least squares) 、 对 角 加 权 最 
小 二 乘法 (diagonal weighted least squares) 和 广义 
最 小 二 乘法 (generalized least squares) hy M(E 
Me, ERM 等 , 2015; MFM, AR 等 ,2015; 
吴 瑞 林 , 2010)。 不 过 这 些 方 法 应 用 不 多 ， 且 早 有 文 
献 指 出 , 与 ML 相 比 它们 的 综合 表现 并 不 突出 ( 侯 
杰 泰 等 , 2004)。 

更 值得 注意 的 是 当前 流行 的 估计 方法 和 新 方 
法 的 比较 。 比 如 刘 红 云 、 骆 方 等 (2012) 模 拟 比 较 了 
MLR 、WLSMV 和 MCMC 方法 估计 二 分 类 数据 测 
量 模型 的 精度 。 结 果 发 现 ,三 种 方法 对 因子 载荷 
等 参数 的 估计 精度 都 比较 好 , MLR 和 WLSMV Ii 


载荷 和 残 差 相 关 自 由 估计 会 因 用 尽 自 由 度 导致 模 
型 不 可 识别 ), 通过 纳入 先 验 信息 和 采用 MCMC 
方法 ， 仍 有 可 能 识别 ( 受 宁 ,， 李 英 等 , 2018); (6) 通 
过 贝 叶 斯 法 获得 的 可 信 区 间 解 释 上 比 传统 置信 区 
间 更 直观 。 

王 重 成 、 邓 俏 文 和 毕 向 阳 (2017)、 受 宁 和 李 英 
等 (2018) 介 绍 了 基于 贝 叶 斯 法 的 SEM (BSEMD) 的 
基本 概念 并 用 示例 演示 了 分 析 过 程 和 结果 解释 。 
张 沥 今 等 (2019) 分 析 了 贝 叶 斯 法 在 不 同 SEM 变 式 
(如 普通 的 测量 模型 、 潜 中 介 模 型 、 潜 增长 模型 、 
多 组 SEM 及 多 层 SEM) 中 的 应 用 优势 及 现状 , 并 
对 BSEM 的 模型 评价 及 可 用 软件 做 了 介绍 。 秦 正 
积 等 (2020) 介 绍 了 如 何 使 用 SAS 软件 调用 
OpenBUGS 程序 以 更 高 效 地 实现 BSEM。 
3.3 ”其 它 参 数 估计 方法 

除了 PLS 和 贝 叶 斯 法 ， 吴 瑞 林 (2012) 建 议 用 
Tikhonov 正则 化 方法 修正 ML 的 参数 估计 ,模拟 
研究 表明 这 有 助 于 提升 收敛 率 和 收敛 速度 ,减少 
不 恰当 解 ， 并 降低 估计 偏差 。 对 于 二 分 类 数据 和 
顺序 等 级 数据 ， 有 研究 者 建议 采用 多 项 相关 和 矩阵 
来 估计 模型 参数 ( 吴 瑞 林 , FEZ, 2010)， 并 给 出 
LISREL 实例 语句 ( 王 欢 等 ，2012; REI) 等 ， 
2012)。 比 起 基于 皮尔 逮 相 关 和 矩阵 的 参数 估计 ， 多 
项 相关 和 矩阵 得 到 的 参数 佑 计 值 偏差 更 小 ( 周 映 雪 
等 , 2013)。 还 有 研究 介绍 SEM 的 约束 最 小 二 乘 解 ， 
并 将 其 推广 到 高 阶 测量 模型 和 多 组 SEM 中 ( 童 乔 
凌 ， 刘 天 桢 等 ，2009; MHA, Ahk |, 
2009)。 该 方法 可 以 提升 参数 估计 的 收敛 率 和 收敛 
速度 ， 并 获得 唯一 解 。 
3.4 “参数 估计 方法 比较 

SEM 参 数 估计 方法 比较 研究 一 部 分 关注 加 权 


优 于 MCMC 方法 , WLSMYV 还 具备 运算 速度 快 的 
EB, FAIRE AH A EE EE AE (2004, 2005) HE HU EL BE T 
ML 和 贝 叶 斯 法 在 SEM 参数 估计 中 的 表现 ， 结 果 
发 现 贝 叶 斯 法 估计 精度 略 优 于 ML, 但 并 不 明显 。 
YEE Wa FA HA Zs (201 6 BLA LBS MLR 和 无 先 验 
贝 叶 斯 法 在 测量 模型 中 的 表现 。 结 果 发 现 . (1) 对 
于 识别 错误 模型 的 能 力 ,在 非 正 态 条 件 下 ， 贝 叶 
斯 方法 更 强 ; 但 在 正 态 条 件 下 ， 贝 叶 斯 方法 不 如 
MLR, (2) 贝 叶 斯 法 收敛 能 力 远 强 于 MLR， 这 个 优 
势 在 复杂 模型 (如 双 因 子 模型 ) 中 尤为 明显 。 受 宁 和 
毛 志雄 等 (2018) 通 过 一 个 应 用 实例 比较 了 ML 和 
贝 叶 斯 法 在 小 样本 潜 变 量 建 模 中 的 表现 ， 尽 管 二 
者 对 路 径 系 数 及 因子 载荷 等 参数 估计 结果 接近 
但 前 者 会 出 方差 为 负 这 样 的 异常 解 。 
替 映 宝 (2006)、 李 晓 鸿 (2012) 和 张 军 (2007) 从 
参数 估计 目的 、 基 本 原理 、 前 提 条 件 等 理论 方面 
比较 了 PLS 与 传统 参数 估计 方法 (如 ML 、 加 权 最 
小 二 乘法 、 对 角 加 权 最 小 二 乘法 和 广义 最 小 二 乘 
法 ) 的 区 别 ; 章 刚 勇 (2015) 则 对 二 者 做 了 模拟 比较 
结果 发 现 PLS 参数 估计 的 稳定 性 强 于 传统 方法 ， 
但 是 对 误 设 模型 的 敏感 性 较 低 。 刘 燕 和 陈 英武 
(2007) #8 tH FA” SC de APA (Generalized Maximum 
Entropy {it SEM 参数 ， 并 模拟 比较 了 广义 最 大 
WA PLS ABBE PE, ZRF STIR 
获得 的 参数 均 方 误差 总 是 小 于 PLS. 
4 结构 方程 模型 评价 

对 SEM 参数 的 解读 是 建立 在 假设 模型 与 实 
际 数据 拟 合 良好 的 基础 上 的 。 评 价 模型 拟 合 主要 
通过 拟 合 指数 ， 涉 及 到 的 方法 学 问题 包括 新 拟 合 
指数 的 提出 、 拟 合 指数 的 临界 值 、 拟 合 指数 的 选 
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择 及 拟 合 指数 之 外 的 模型 评价 标准 。 此 外 ,多 个 
模型 间 的 比较 和 选择 也 是 模型 评价 的 重要 方面 。 
41 ” 拟 合 指数 的 发 展 

自 SEM 流行 以 来 , 研究 者 陆续 提出 过 40 多 
个 拟 合 指数 , 温 忠 甩 等 (2004) 探 讨 了 好 的 拟 合 指 
数 应 有 的 性 质 (不 受 样本 容量 系统 影响 、 惩 罚 复杂 
模型 及 对 误 设 模型 敏感 )。 现 在 普遍 认为 ，CFI 
(comparative fit index), TLI (Tucker-Lewis index), 


RMSEA (root mean square error of approximation) 
和 SRMR (standardized root mean square residual) 
是 统计 学 性 质 较 好 的 拟 合 指 数 ( 温 忠 详 ， 刘 红 云 ， 
2020)。 

近年 来 有 研究 尝试 提出 新 的 拟 合 指数 ， 比 如 
王 凯 等 (2018) 针 对 拟 合 指数 GFI (goodness-of-fit 
index) 受 样本 容量 系统 影响 及 未 惩罚 复杂 模型 的 
缺陷 ,提出 了 校正 后 的 GFI (corrected GFI, 
CGFD。 男 一 种 新 拟 合 指数 是 Yuan 和 Chan (2016) 
提出 的 基于 等 效 性 检验 的 拟 合 指数 (equivalence- 
testing-based fit indice; 王 阳 等 ,2020)。 其 基本 思 
REE, 针对 传统 ?的 逻辑 问题 (将 零 假 设 模型 完全 
拟 合作 为 想 要 证 明 的 假设 ), 设置 新 的 零 假设 ( 模 
型 误 设 大 于 一 个 可 以 容忍 的 小 正 数 ) 和 备 择 假设 
(模型 误 设 不 大 于 可 容忍 误 设 )。 在 此 基础 上 ， 提 出 
与 之 相 适 应 的 拟 合 指数 RMSEA, 和 CFI。 与 传统 
RMSEA 和 CFI 不同, RMSEA, 和 CFI 具有 推断 统 
计 性 质 。 以 RMSEA, 为 例 ， 它 表示 模型 误 设 的 大 
小 不 超过 RMSEA, 且 做 出 这 一 推断 犯错 误 的 概 
率 不 超过 显著 性 水 平 a。 

另外 ， 对 于 近年 来 受到 关注 的 BSEM， 有 专 
门 的 拟 合 评价 指标 : (1) 后 验 预 测 p 值 (posterior 
predictive p value, ppp)。 它 反映 观测 数据 拟 合 函数 
和 基于 后 验 分 布 的 样本 数据 拟 合 函 数 间 的 差距 
CRAM, BH, 2016), 近似 0.5 表示 模型 拟 合 
良好 , 接近 0 或 1 表示 拟 合 不 佳 。(2) 贝 叶 斯 因子 
(Bayes factors)。 可 粗略 地 理解 为 当前 数据 对 两 个 
竞争 模型 支持 强度 的 比值 。 经 验 上 ， 两 个 将 争 模 
型 的 贝 叶 斯 因子 大 于 10, 表示 有 较 强 证 据 支 持 贝 
叶 斯 因子 分 子 所 代表 的 模型 ; 贝 叶 斯 因子 小 于 
1/10， 表 示 有 较 强 证 据 支 持 贝 叶 斯 因子 分 母 所 代 
表 的 模型 ( 胡 传 鹏 等 , 2018); 贝 叶 斯 因子 在 1/3~3 
之 间 ， 表 示 数 据 对 两 个 模型 的 支持 力度 差不多 ( 张 
WA 等 , 2019)。(3) Lyo 该 统计 量 相 较 于 贝 叶 斯 因 
T, 具备 计算 量 更 小 ， 且 对 先 验 信息 依赖 更 少 的 


PER Ly 越 小 的 模型 拟 合 越 好 。 李 云 仙 等 的 系列 
论文 详细 介绍 了 工 , 的 统计 原理 ， 并 将 其 用 于 带 有 
有 序 变 量 和 缺失 数据 的 SEM 及 两 水 平 SEM 的 模 
型 选择 ( 李 云 仙 ， 王 学 仁 , 2011，2012; Fail, B 
爱 军 ，2014) 。(4) 贝 叶 斯 信息 指数 (Bayesian 
information criterion,，BIC) 和 异常 信息 指数 (deviance 
information criterion, DIC), 这 两 个 指标 均 只 用 于 模 
型 比较 , 数值 越 小 表示 模型 拟 合 越 好 。 

此 外 ， 当 数据 不 服从 正 态 分 布 ， 有 研究 提出 
用 Satorra-Bentler 校正 x? 评价 模型 拟 合 ( 刘 小 琴 
等 , 2013)。 金 勇 进 和 深 燕 (2005) 介 绍 了 适用 于 基于 
PLS 的 SEM 的 拟 合 评价 指标 , 包括 因子 共同 度 、 
R (外 生 潜 变 量 对 内 生 潜 变量 的 预测 效果 )、 克 余 
(由 外 生 潜 变量 所 解释 的 内 生 潜 变量 测量 指标 平 
均 方 差 ) 等 。 

42 ” 拟 合 指 数 的 临界 值 

针对 常用 拟 合 指数 CFI, TLI, RMSEA 和 
SRMR, 一 般 认 为 , CFI 和 TLI 不 低 于 0.9 (Bentler 
& Bonett, 1980), RMSEA 和 SRMR 不 高 于 0.08 
Hy} (Browne & Cudeck, 1992)， 模 型 可 以 接受 。 但 也 
有 研究 者 建议 使 用 更 高 的 标准 : CFI 和 TLI 不 低 
于 0.95, RMSEA 和 SRMR 不 高 于 0.05 (Hu & 
Bentler, 1999), 现在 通常 将 这 一 较 严 苛 的 标准 作 
为 模型 拟 合 优秀 的 标准 。 此 类 临界 标准 只 是 一 种 
基于 经 验 的 约定 俗 成 的 判断 。 

有 研究 者 通过 设计 一 些 特殊 的 真 模型 和 错误 
模型 展开 模拟 研究 ,根据 各 拟 合 指数 采取 不 同 临 
界 值 时 两 类 错误 率 之 和 来 确定 不 同 条 件 下 最 佳 的 
拟 合 临界 值 ( 郭 庆 科 等 , 2007, 2008)。 然 而 ， 真 模 
型 与 错误 模型 的 差距 复杂 多 样 ， 拟 合 最 佳 临界 值 
会 随 这 一 差距 的 变化 而 改变 。 有 文献 指出 这 种 通 
过 模拟 研究 确定 固定 临界 值 的 做 法 是 不 恰当 的 
( 温 忠 麟 ， 候 杰 泰 , 2008; Marsh et al., 2004)。 

43 拟 合 指数 的 选用 

由 于 存在 诸多 拟 合 指数 可 供 使 用 ， 需 要 考虑 
选择 报告 哪些 指数 。 王 长 义 等 2010) 通 过 总 结 和 分 
析 已 有 的 拟 合 指数 性 能 评估 研究 , 认为 TLU 和 
RMSEA 是 最 值得 信赖 的 拟 合 指 数 ， 不 过 CFI, 
RNI, Mc, SRMR 和 X2df 也 有 一 定 参 考 价值 。 还 
有 研究 者 通过 分 析 拟 合 指数 的 公式 ， 发 现 除 了 理 
论 模 型 不 优 于 独立 模型 ( 即 只 有 显 变量 且 互 不 相 
关 的 模型 ) 的 极端 情况 ,总 有 CFISTLI ( 温 涵 ， 梁 
Pi, 2015)。 所 以 ， 当 TLI 可 以 接受 , CFI 就 是 多 
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余 的 。 而 且 ，CFI 不 惩罚 复杂 模型 ( 温 忠 记 等 ， 


然后 将 这 些 参数 赋 给 样本 二 ， 并 查看 其 拟 合 。 还 


2004)， 当 几 个 模型 都 能 拟 合 数据 时 ,无 法 帮助 研 
究 者 选 出 更 简洁 的 模型 。 这 样 ， 研 究 者 选择 报告 
TLI、RMSEA 和 SRMR 即 可 。 
44 ”其 它 模型 评价 标准 
应 用 研究 者 往往 将 拟 合 指数 作为 最 重要 甚至 
:一 的 模型 评价 标准 。 很 多 文献 对 此 做 法 提出 批 
评 。 一 方面 ， 每 种 指数 都 只 是 从 一 个 特定 角度 评 
价 拟 合 ， 有 其 固有 局 限 ( 王 阳 等 , 2020)。 另 一 方 画 
拟 合 指数 普遍 受 模型 拟 合 程度 之 外 的 其 它 因素 影 
响 ， 如 样本 上 容量、 数据 分 布 、 因 子 载荷 、 参 数 佑 
计 方 法 等 ( 王 阳 等 , 2020; WEB, E73, 2008; 
Shi & Maydeu-Olivares, 2020)。 所 以 评价 模型 拟 合 
有 必要 参考 其 它 标准 ， 如 参数 估计 评价 、 整 体 拟 
合 内 部 拟 合 及 复核 效 度 检 验 等 ( 侯 杰 泰 等 , 2004; 
Yak MBE S, 2004, WERE, RAZ, 2008; 郑 文智 ， 
RMB, 2014)。 

首先 ， 可 考察 参数 估计 过 程 是 否 正常 收敛 。 
出 现 识别 或 收敛 问题 往往 是 因为 模型 设 定 不 合 
理 。 然 后 检查 4 个 方面 内 容 : (1) 模 型 参数 符号 是 
否 恰当 、 是 否 统计 显著 ? 不 显著 考虑 修改 ( 修 杰 泰 
等 , 2004)。(2) R? 是 否 足 够 大 ?对 于 测量 模型 ， 太 
小 的 R? 说 明 载 荷 太 低 ， 意味 着 条 目 信 和 度 过 低 ( 温 
ER, 侯 杰 泰 , 2008)。 不 少 研究 发 现 拟 合 指数 倾向 
于 支持 信 度 更 低 的 模型 (如 Greiff & Heene, 2017), 
所 以 需要 同时 权衡 拟 合 指数 和 信和 度 。(3) 残 差 矩 阵 
有 无 异常 元 素 ( 温 忠 己 ， 侯 杰 泰 ，2008)， 太 大 的 残 
差 绝 对 值 意味 着 理论 模型 和 数据 有 明显 差距 。(4) 
哪些 路 径 或 载荷 有 较 大 的 修正 指数 ( 侯 杰 泰 等 ， 
2004)? 过 大 的 修正 指数 意味 着 模型 中 的 箭头 可 
能 指 错 了 位 置 。 看 拟 合 指数 之 前 先 分 析 这 些 与 参 
数 估计 有 关 的 评价 指标 可 以 提升 对 误 设 模型 的 检 
KIORE, ERR, 2008; MICH, RICH, 
2014). 

参数 估计 评价 之 后 ， 才 看 拟 合 指数 。 拟 合 指 
数 是 对 模型 整体 拟 合 情 况 的 评价 。 除 此 之 外 , 还 
可 以 考察 模型 内 部 拟 合 ， 即 从 模型 的 内 在 质量 评 
价 每 个 潜 变 量 的 设置 是 否 恰 当 ( 郑 文智 ， 吴 文 角 ， 
2014). 主要 包括 (1) 检 查 测量 工具 信和 度 ， 可 以 使 用 
CFA 计算 合成 信和 度 ; (2) 检 查 测 量 工具 效 度 ， 包括 
内 容 效 度 、 效 标 关联 效 度 和 结构 效 度 。 

此 外 ,还 可 以 考察 复合 效 度 ( 即 交 义 验 证 )， 
将 数据 一 分 为 二 ， 用 样本 一 (校正 样本 ) 估 计 参 数 ， 


> 


kis 


可 以 对 比 两 个 样本 所 得 结果 的 差异 ( 郑 文智 ， 吴 
毅 ，2014)。 理 想 情 况 是 两 个 样本 所 得 拟 合 都 比 
好 且 接 近 。 
4.5 ”模型 比较 和 选择 的 策略 

对 于 同一 批 数 据 ， 能 够 良好 拟 合 的 模型 可 能 
不 止 一 个 ,此 时 需要 通过 比较 多 个 模型 的 拟 合 来 
选择 最 优 模 型 . 柳 恒 超 等 2007) 介 绍 了 巷 套 模型 的 
概念 和 特点 及 艇 套 模型 和 非 艇 套 模型 的 比较 和 选 
择 方法 。 对 于 艇 套 模型 ， 他 们 建议 比较 5 个 模型 ; 
独立 零 模型 Mn、 饱 和 模型 Ma、 感 兴趣 的 理论 模 
型 Mt， 以 及 两 个 其 次 感 兴趣 的 理论 模型 Me 和 
Mu. 首先 用 Ma 的 六 (最 小 和 和 Mn 的 自由 度 (最 
大 自由 度 ) 进 行 巡 检 验 ， 如 果 统 计 显 著 ， 则 所 有 模 
型 都 不 可 接受 ; 如 果 不 显 著 ， 则 通过 各 模型 间 的 
xX 差异 检验 寻找 最 优 模 型 。 对 于 非 谋 套 模型 ， 一 
般 建 议 比 较 期 望 交 又 验证 指数 (expected cross- 
validation index, ECVI) 和 Akaike 信息 指数 (Akaike 
information criterion, AIC), 这 两 个 指数 越 小 的 模 
型 越 好 。 骆 方 和 张 厚 紧 (2006) 以 创造 性 思维 测验 为 
例 ， 演 示 了 如 何 根据 x 差异 检验 和 模型 的 简洁 性 
来 比较 和 选择 最 佳 CFA 模型 。 此 外 , 32005) 
介绍 了 如 何在 非 线 性 SEM 中 利用 贝 叶 斯 因子 选 
择 最 佳 模 型 。 


5 多 组 测量 模型 (测量 不 变性 ) 


测量 不 变性 (measurement invariance) 是 指 
SEM 在 不 同 群体 或 时 间 有 相同 结构 及 参数 值 ， 一 
般 涉 及 到 检验 模型 形态 、 因 子 载荷 、 截 距 项 、 因 
子 与 误差 的 方差 - 协 方 差 及 洪 均 值 不 变性 ( 潜 均 值 
比较 涉及 均值 结构 模型 ,是 SEM 的 特殊 形式 之 一 ; 
IRRE 等 ,2004)。 国内 大 部 分 有 关 测 量 不 变性 的 
方法 文献 侧重 于 介绍 测量 不 变性 要 检验 的 各 种 模 
型 、 检 验 流程 及 模型 评价 标准 (例如 白 新 文 ， 陈 
BLL, 2004; 刘 军 , 2005; 刘 军 ， 吴 维 库 , 2005; XI 
WU, ERA, 2015; 魏 修 建 ， 郑 广 文 ， 2015; 武 
淑琴 ， 张 岩 波 ，2011; 武 淑琴 等 ,2009; 许 宏 晨 ， 
2010; 张 连 生 等 ,2012; 赵 必 华 ，2007; 郑 广 文 
等 , 2014)。 此 外 ,还 有 两 个 测量 不 变性 的 研究 方向 
受到 关注 。 第 一 是 特定 模型 或 数据 中 如 何 实现 测 
量 不 变性 分 析 。 如 郑 显 亮 等 2011) 介 绍 了 二 阶 因子 
模型 的 测量 不 变性 分 析 方 法 。 其 与 传统 测量 不 变 
性 分 析 的 主要 差别 在 于 ,各 项 不 变性 约束 都 要 分 
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别 在 一 阶 和 二 阶 水 平 上 进行 设 定 。 李 冲 和 刘 红 去 
(2011) 建 议 在 进行 等 级 数据 的 测量 不 变性 分 析 时 ， 


FIML) 是 目前 最 为 研究 者 所 推崇 的 缺失 处 理 方法 
(EH, XGA SC, 2016), MI 对 缺失 数据 进行 多 次 


使 用 WLSMV 估计 参数 ,并 以 基于 WLSMV 的 校 
IE y AERE (correct chi-square difference test, 
DIFFTEST) ERRERA, UAT SELF Fe RH, 


填补 , 用 每 个 填补 后 的 完整 数据 集 进 行 分 析 从 而 
获得 目标 参数 的 多 个 估计 值 ， 最 后 将 多 个 估计 值 
进行 汇总 获得 最 终 参 数 估计 值 ; FIML 则 不 对 缺失 


WLSMYV 对 因子 载荷 和 阔 值 参数 的 估计 准确 性 高 ， 
DIFFTEST 的 两 类 错误 率 也 可 以 接受 ( 李 冲 ， 刘 红 
云 ， 2011)， 且 这 些 方 法 的 表现 并 不 逊 于 基于 项 目 
反应 理论 的 方法 ( 刘 红云 ， 李 冲 等 , 2012)。 

第 二 方面 , 测量 不 变性 分 析 中 ,不 少 约束 模 
型 太 过 严格 , 不 易 实现 ( 温 聪 聪 等 , 2018)。 有 研究 
专门 讨论 这 一 问题 。 比 如 ， 当 形态 不 变性 和 载荷 
不 变性 成 立 , 但 截 距 不 变性 未 能 满足 ， 如 果 研 究 
者 还 想 比 较 潜 均 值 ， 可 以 采用 投影 法 ( 王 阳 等 ， 
2020; Deng & Yuan, 2016)。 该 法 将 每 个 组 的 显 变 
量 均值 分 解 为 两 个 正 交 的 成 分 : 公分 数 (代表 潜 均 
值 ) 和 特殊 因子 。 这 两 个 成 分 的 跨 组 不 变性 分 析 都 
不 依赖 截 距 项 ， 从 而 使 潜 均 值 比较 可 以 直接 绕 过 
截 距 不 变 这 一 传统 前 提 。 

如 果 只 有 形态 不 变性 成 立 , 但 之 后 的 不 变性 
约束 模型 拟 合 不 佳 ， 建 议 采 用 对 齐 法 , 构建 一 个 
反映 各 组 截 距 和 载荷 差 值 的 损失 函数 ， 并 求 取 使 
损失 函数 最 小 的 载荷 与 截 距 估 计 值 。 此 时 , 约束 
模型 中 各 组 对 应 参数 虽然 不 完全 相等 , 但 足够 接 
近 ; MA, 该 模型 与 形态 不 变 模 型 有 相同 的 拟 合 
度 。 对 章法 可 以 视 为 一 种 近似 不 变性 模型 。 该 法 
的 具体 原理 、 应 用 实例 和 Mplus 语句 参见 温 聪 聪 
4 (2018). 此外, 最近 也 有 研究 者 建议 利用 BSEM 
分 析 测 量 不 变性 。 通 过 给 需要 检验 的 参数 设置 均 
值 为 0 是 方差 极 小 的 先 验 分 布 ,达到 放宽 参数 跨 
组 不 变 限 制 , 实现 近似 不 变性 分 析 的 目的 ( 宋 琼 雅 
等 , 2021)。 


6 ”结构 方程 模型 中 的 特殊 数据 处 理 


这 里 说 的 特殊 数据 处 理 主要 包括 缺失 数据 、 
非 连续 数据 、 非 正 态 数 据 及 洪 变 量 得 分 等 。 
6.1 SEM 中 的 数据 缺失 问题 


值 进行 奉 换 ， 而 是 根据 未 缺失 数据 的 信息 采用 和 迭 
代 的 方式 进行 估计 。 MI 优势 包括 充分 考虑 了 数据 
的 不 确定 性 、 能 更 灵活 地 处 理 同时 包含 连续 和 非 
连续 变量 的 混合 数据 (Mansolf et al., 2020); 不 足 
在 于 MI 的 分 析 过 程 更 复杂 ， 耗 时 更 长 ( 叶 素 静 等 ， 
2014)。FIML 的 主要 优势 是 操作 简便 ( 王 孟 成 ， 邓 
俏 文 ,2016), 不 足 是 有 时 会 遇 到 第 一 类 错误 率 偏 
高 及 模型 收敛 问题 (Mansolf et al., 2020)。 

方法 比较 方面 , 杨 林 山 和 草 亦 逢 (2012) 模 拟 
比较 了 完全 贝 叶 斯 法 (将 缺失 数据 视 为 未 知 参数 ， 
通过 模拟 全 体 变量 与 缺失 值 的 联合 后 验 分 布 来 佑 
计 模 型 参数 和 缺失 值 ) 和 部 分 贝 叶 斯 法 (相当 于 贝 
叶 斯 估计 时 忽略 缺失 ) 处 理 LGM 中 缺失 数据 的 效 
果 。 结 果 发 现 缺失 比例 超过 50% 时 ,前 者 的 均 方 
误差 明显 小 于 后 者 ， 即 参数 估计 精度 更 高 ; 而 缺 
失 比 例 较 小 时 ， 二 者 效果 接近 。 陈 楠 和 刘 红 云 
(2015) 模 拟 比 较 了 ML 和 Diggle-Kenward 选择 模 
型 这 两 种 方法 处 理 LGM 中 非 随 机 缺失 的 效果 ， 
总 体 上 后 者 效果 更 好 。 邓 居 敏 等 (2018) 用 一 个 实证 
数据 比较 了 列 删 法 (listwise deletion)、 期 望 最 大 化 
算法 (expectation maximization algorithm)、MI 和 
FIML 处 理 SEM 中 缺失 数据 的 效果 , 发现 MI 和 
FIML 获得 的 模型 拟 合 较 好 ， 期 望 最 大 化 算法 获 
得 的 参数 标准 误 最 小 ， 而 列 删 法 获得 的 参数 标准 
误 最 大 , 王 孟 成 和 邓 俏 文 (2016) 通 过 模拟 研究 探讨 
了 利用 FIML 处 理 SEM 数据 缺失 时 辅助 变量 的 作 
FA, 总 的 来 说 纳入 辅助 变量 有 助 于 得 到 更 可 靠 的 
参数 估计 。 
6.2 SEM 中 的 非 连续 及 非 正 态 数据 问题 

社 科 研究 中 所 用 的 问卷 数据 经 常 是 有 序 分 类 
的 ， 直接 将 其 作为 连续 变量 建 模 可 能 会 降低 参数 
估计 精度 和 模型 拟 合 ， 高 静 (2012) 提 出 了 一 个 有 


SEM 建 模 时 如 果 缺 失 数据 过 多 ,可 能 导致 模 
型 估计 出 现 问题 (如 协 方差 矩阵 非 正 定 ; PR HS 
等 ,2010)。 推 荐 好 的 缺失 数据 填补 方法 及 对 比 不 
同方 法 的 效果 是 重要 的 研究 工作 。 方 法 推荐 方面 ， 
多 重 填补 法 (multiple imputation，MD 和 全 信息 极 大 
似 然 估 计 法 (full information maximum likelihood, 


序 分 类 数据 的 连续 化 处 理 程序 ， 并 通过 应 用 示例 
展示 了 这 种 方法 对 模型 拟 合 的 提升 。 

方 敏和 黄 正 峰 (2010) 介 绍 了 非 正 态 数据 的 常 
用 SEM 建 模 方法 ,推荐 使 用 Bollen-Stine 
Bootstrap 法 校正 x 检验 结果 ,并 给 出 了 Amos 操 
作 演 示 。 
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6.3 SEM 中 的 潜 变量 得 分 问题 

张 岩 波 等 (2005) 介 绍 了 SEM 中 潜 变 
估计 原理 ， 并 用 LISREL 演示 了 潜 变 量 
算 。 刘 表 和 刘 红 云 (2017) 介 绍 了 双 因 子 模型 中 全 局 
因子 和 局 部 因子 的 加 权 因 子 分 计算 方法 , 模拟 研 
究 表明 相对 于 其 它 测验 总 分 和 维度 分 的 合成 方法 ， 
加 权 因 子 分 最 接近 真 分数 ， 信 和 度 最 高 。 此 外 ， 张 洁 
婷 等 (2012) 介 绍 了 潜 变 量 数据 类 型 的 确定 方法 。 


7 其 它 议 题 


fa 
T 
T 
+ 


除 上 述 5 大 主题 ， 国 内 SEM 方法 研究 还 有 一 
些 值得 关注 的 主题 , 包括 传统 统计 和 测量 方法 如 
何 纳 入 SEM 框架 、 对 误差 相关 问题 的 讨论 SEM 
建 模 步骤 的 改进 、SEM 检验 力 分 析 等 。 

鉴于 SEM 的 诸多 优势 及 其 与 其 它 统计 方法 
的 兼容 性 ， 有 研究 者 介绍 了 传统 统计 和 测量 方法 
与 SEM 的 结合 方法 ,以 提升 分 析 准 确 性 和 建 模 灵 
活性 。 如 基于 CFA 模型 的 信和 度 计 算 ( 见 : TEER, 
陈 虹 喜 等 , 2022) FEF SEM 的 各 类 中 介 模 型 ( 见 : 
温 忠 麟 ， 方 杰 等 , 2022) 与 调节 模型 ( 见 : 方 杰 等 ， 
2022)、 基 于 SEM 的 多 水 平 模型 ( 毕 向 阳 , 2019; 方 
杰 等 ，2011; 张 岩 波 等 ，2006; KAM F, 
2008)、 基 于 SEM 的 元 分 析 ( 桂 裕 亮 等 , 2016; 钱 
X= 等 ,2015)、 基 于 SEM 的 时 间 序 列 分 析 ( 朱 苗 
苗 ，2016)、 基 于 SEM 的 人 工 神经 网 络 模型 ( 颜 波 
等 , 2019; 赵 海峰 , Fray, 2003), 基于 SEM 的 条 
目 因子 分 析 (item factor analysis， 吴 瑞 林 ， 涂 冬 波 ， 
2013)、 基 于 SEM 的 指标 体系 ( 即 为 抽象 概念 建立 
的 带 权 重 、 分 层级 的 测量 指标 系统 ; 页 新 明 , 2011; 
斯 介 生 等 ,2014; 田 飞 ，2007; ESX, PE, 
2004; 俞 立 平 , 2020; 张 瑛 ， 王 惠 文 , 2008) 、 基 于 
SEM 的 模糊 综合 评价 算法 ( 庄 伟 狠 ,， 刘 震 宇 ， 
2013)、 基 于 SEM 的 隐 马 尔 可 夫 模 型 ( 王 坤 等 ， 


针对 SEM 建 模 过 程 中 不 恰当 的 模型 设 定 可 
能 降低 模型 拟 合 的 问题 ， 陈 明亮 (2004) 提 出 改进 
SEM 的 建 模 步 又 ， 主 要 是 增加 识别 和 剔除 不 恰当 
问卷 条 目 ( 与 所 测 变量 相关 偏 低 或 与 其 它 条 目 相 
关 过 大 的 条 目 ) 及 相关 性 过 强 的 变量 ， 并 重新 评估 
测量 模型 和 结构 模型 拟 合 的 步骤 。 

安 繁 (2016) 总 结 了 SEM 中 检验 力 分 析 的 常用 
方法 ,并 以 师 生 关系 问卷 为 例 说 明了 如 何 用 
Mplus 进行 检验 力 分 析 。 王 惠 文 和 张 瑛 (2007) 介 绍 
了 SEM 的 后 推 预测 算法 ， 即 如 何 根据 变量 当前 形 
成 的 SEM 预测 未 来 变量 间 的 关系 ， 并 通过 模拟 研 
究 支 持 了 该 算法 的 预测 效果 。 单 娜 和 张 笑 笑 (2020) 
通过 数学 推导 ， 给 出 了 因 变 量 和 协 变量 (同时 影响 
自 变 量 和 因 变 量 的 无 关 变 量 ) 均 为 潜 变 量 ， 而 自 变 
量 是 显 变量 时 , 平均 因果 效应 的 计算 方法 。 贾 新 
明和 刘 亮 (2008) 从 变量 、 样 本 、 数 据 、 参 数 估计 和 
模型 解释 几 个 方面 比较 了 SEM 与 联 立 方程 模型 
的 异同 点 。 


8 讨论 与 拓展 


新 世纪 20 年 来 , SEM 得 到 越 来 越 多 社会 学 科 
的 重视 和 应 用 ,这 也 带动 了 SEM 方法 研究 的 发 
Ro 在 国内 ,十 余 个 不 同学 科 为 SEM 方法 研究 做 
出 了 贡献 , 在 5 个 主题 上 有 较 多 的 研究 成 果 。2020 
年 后 至 今 ， 仅 追踪 研究 中 的 SEM 这 一 个 方向 ， 就 
增加 了 多 篇 文献 ( 方 俊 燕 等 ， 印 刷 中 ; 高 文 阳 等 ， 
2021; 刘 源 , 2021; 温 聪 陪 ， 朱红, 2021; 袁 帅 等 ， 
2021; Mat Hy 等 ,2021)。 具 体 介 绍 见 刘 源 等 
(2022)， 这 里 不 再 袭 述 。 在 其 它 方向 ， 如 测量 不 变 
性 、SEM 中 的 检验 力 分 析 和 分 类 数据 处 理 以 及 不 
同类 型 测量 指标 ( 即 形成 性 和 反应 性 指标 ) 的 选用 
策略 与 相应 模型 的 统计 分 析 方 法 ， 也 有 新 的 进展 
(ABE, BENE, 2022; RSE, FUG Be, 2022; 


2018; 夏 业 茂 等 , 2016) 及 基于 双 因 子 模型 的 计算 
机 自 适 应 测验 ( 刘 暮 婷 等 ,2019; 毛 秀 珍 等 ， 
2019; 毛 秀 珍 等 , 2018)。 

通常 SEM 中 如 无 充分 理据 ,不 应 设 定 测量 误 
差 相 关 。 当 误差 项 之 间 存 在 系统 性 相关 来 源 时 ， 
可 以 设 定 误差 相关 ， 如 相同 方法 测量 的 条 目的 误 
差 、 同 一 条 目的 多 次 重复 测量 的 误差 设 定 为 相关 
是 合理 的 。 男 外 ， 当 模型 存在 多 个 较 大 的 误差 相 
关 修 正 指 数 ， 可 以 通过 增设 潜在 共同 方法 因子 来 
解释 误差 相关 ( 胡 鹏 SE, 2018)。 


宋 琼 雅 等 , 2021; FARA 等 , 2022)。 为 了 更 好 地 
对 SEM 的 当下 研究 有 所 了 解 ， 这 里 也 介绍 一 些 国 
外 较 新 的 SEM 方法 学 研究 ,可 以 发 现 一 些 值 得 国 
内 方法 学 者 未 来 探索 和 拓展 的 方向 。 
81 原 有 主题 的 拓展 

在 模型 的 发 展 方面 , 简要 介绍 双 因 子 ESEM 
All SEM 树 。 尽 管 双 因子 模型 和 ESEM 各 自 克 服 了 
传统 CFA 的 一 些 重要 局 限 , 但 也 都 有 不 足 ， 前 者 
忽视 了 跨 因子 载荷 普遍 存在 的 事实 ,可 能 使 因子 
相关 被 高 估 ; 后 者 则 忽视 了 高 阶 因子 存在 的 可 能 
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性 ， 容 易 导 致 跨 因 子 载荷 偏 高 。 将 双 因 子 模型 和 
ESEM 结合 起 来 的 双 因 子 ESEM 很 好 地 弥补 了 两 
种 模型 独立 使 用 时 的 局 限 (Morin et al., 2016). 

SEM 树 是 SEM 和 决策 树 的 结合 ,可 以 根据 
研究 者 选 定 的 预测 变量 (如 儿童 的 运动 技能 、 学 习 
方式 和 生活 常识 等 ) 为 某 一 结果 变量 或 结果 变量 
的 变化 轨迹 (如 儿童 阅读 能 力 的 发 展 轨迹 ) 进 行 分 
类 。 当 存在 很 多 有 价值 的 预测 变量 、 预 测 变 量 间 
普遍 存在 交互 作用 或 对 分 类 的 个 数 缺 乏 先 验 知识 
It, SEM 树 被 认为 是 有 限 混合 模型 ( 即 LCM, 
LPM, LCGM, GMM 及 PGMM 这 一 类 方法 ) 的 良 
好 替代 (Jacobucci et al., 2017). 

在 参数 估计 方法 方面 ,简要 介绍 模型 存在 误 
设 时 参数 估计 精确 度 研究 的 进展 及 参数 估计 不 确 
定性 的 评价 。Lai 和 Zhang (2017) 通 过 模拟 比较 研 
究 发 现 ， 对 于 CFA 模型 , ML 在 模型 有 较 严 重 误 设 
时 仍 可 以 提供 可 靠 参 数 点 估计 ; 但 对 于 完整 的 
SEM， 当 误 设 较 大 时 ,各 类 参数 估计 方法 的 偏差 
都 比较 大 。Pek 和 Wu (2018) 提 出 的 可 替换 参数 估 
计 (fungible parameter estimates) 评 价 了 SEM 参数 
估计 无 关 抽样 变异 的 敏感 性 。 

在 模型 评价 方面 ， 简 要 介绍 一 些 拟 合 指数 ( 包 
括 局 部 拟 合 检验 和 BSEM 的 拟 合 指数 ) 及 临界 值 
的 新 动态 。 传 统 的 拟 合 指数 只 用 于 评价 模型 整体 ， 
Thoemmes 等 (2018) 提 出 的 局 部 拟 合 检验 为 模型 


题 ， 可 以 从 新 的 不 同 角度 前 释 跨 组 测量 不 变性 
(Bauer, 2017; de Roover et al, 2020; Schulze & Pohl, 
2021). 

此 外 , 还 有 特殊 数据 的 SEM 的 拓展 ,涉及 
Logistic 潜 增 长 模型 名义 变 量 的 因子 分 析 等 非 连 
续 数据 的 SEM 建 模 方法 (Asparouhov & Muthén, 
2021)、 小 样本 数据 建 模 相关 的 研究 (Jiang & Yuan, 
2017; Smid & Winter, 2020), 

8.2 ”开拓 新 主题 

SEM 领域 新 的 主题 不 断 涌现 , 例如 ， 以 探索 
为 目的 的 SEM、 基 于 实验 研究 的 SEM. 工具 变量 
(instrumental variables) 在 SEM 中 的 使 用 及 SEM 软 
件 包 的 开发 等 。 

SEM 绝 大 多 数 应 用 都 是 验证 性 质 的 , 但 是 对 
于 包含 海量 数据 的 大 型 研究 ， 可 能 需要 在 缺乏 预 
先 假设 的 前 提 下 探索 多 个 前 因 变 量 中 哪些 是 有 实 
际 作用 的 。 这 种 探索 视角 下 的 SEM 可 以 用 正则 化 
方法 (Regularization) 来 实现 。 正 则 化 SEM 通过 给 
拟 合 函数 增加 一 个 惩罚 项 或 给 参数 设 定 特殊 的 先 
验 (如 小 方差 的 跨 因子 载荷 先 验 )， 将 偏 小 的 系数 
缩减 到 0， 从 而 起 到 变量 或 路 径 筛 选 的 作用 
(Jacobucci et al., 2016; Lu et al., 2016; Muthén & 
Asparouhov, 2012; Pan et al., 2017). 

近年 来 国外 不 少 方法 文献 将 实验 研究 中 的 传 
统统 计 方法 与 潜 变 量 建 模 思 路 相 结合 ， 形 成 了 基 


的 不 同 部 分 分 别提 供 拟 合 评 价 ， 有 助 于 定位 模型 
误 设 的 来 源 ， 即 使 模型 未 识别 或 不 收敛 ， 依 然 可 
以 使 用 。 

随 着 BSEM 的 流行 ， 如 何 评价 它 的 拟 合 优 度 
成 为 一 个 重要 问题 。BSEM 使 用 的 拟 合 评价 指标 
并 不 是 研究 者 所 熟悉 的 传统 拟 合 指数 ， 而 且 大 多 
只 用 于 模型 比较 (如 贝 叶 斯 因子 和 异常 信息 指数 )。 
Garnier-Villarreal 和 Jorgensen (2020) 用 参数 后 验 
均值 取代 入 构建 了 基于 BSEM 的 RMSEA, CFI 
和 TLI 等 7 个 新 拟 合 指数 。 

对 于 临界 值 的 划分 McNeish 和 Wolf (2021) 
提出 了 一 种 基于 数据 模拟 技术 的 动态 拟 合 指数 
(dynamic fit index) 临 界 值 ， 这 种 临界 值 考 虑 到 了 
影响 模型 拟 合 的 各 种 模型 和 数据 特征 因素 ， 可 以 
有 效 地 拒绝 误 设 模型 。 

在 测量 不 变性 分 析 方 面 ， 通 过 定义 新 的 条 目 
功能 差异 (differential item functioning，DIF) 或 将 
不 变性 问题 看 成 是 有 关 模 型 参数 的 聚 类 或 调节 问 


于 实验 研究 的 潜 变 量 建 模 方法 。 例 如 ，Breitsohl 
(2019) 比 较 了 被 试 间 方 差分 析 和 两 种 基于 SEM 的 
方法 : 结构 均值 模型 (structured-means-modeling) 
和 多 指标 多 因 模 型 multiple-indicator multiple- 
cause). PAF! SEM 方法 都 将 因 变 量 表示 为 潜 变 量 ， 
区 别 是 结构 均值 模型 同时 给 每 个 实验 处 理 对 应 的 
因 变 量 建 模 并 比较 潜 均 值 ， 而 多 指标 多 因 模 型 是 
直接 建立 潜 因 变量 对 操纵 变量 的 回归 。 又 如 ， 
Langenberg 等 (2020) 提 出 的 潜 重 复 测量 方差 分 析 
(latent repeated measures analysis of variance) 将 单 
指标 显 性 结果 变量 蔡 换 为 多 指标 潜 变 量 , 提升 了 
主 效应 和 交互 效应 的 检验 力 ,， 放松 了 有 关 缺 失 和 
残 差 结构 的 假设 , 并 能 通过 测量 不 变性 分 析 验 证 
强 不 变性 是 否 满足 。 
工具 变量 是 研究 者 不 感 兴趣 但 能 够 解释 预测 
变量 内 生性 ( 即 预测 变量 与 模型 残 差 相 关 )， 且 与 
模型 残 差 无 关 的 变量 。 通 过 使 用 工具 变量 , 将 预 
测 变量 分 解 为 与 残 差 无 关 的 外 生 部 分 及 与 残 差 相 
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关 的 内 生 部 分 ， 仅 使 用 外 生 部 分 估计 感 兴趣 的 路 
径 系数 。 这 样 可 以 解决 内 生性 问题 ， 获 得 对 模型 
系数 更 准确 的 估计 ， 从 而 提升 SEM 的 因果 推断 能 
力 (Maydeu-Olivares et al., 2020)。 

尽管 SEM 有 很 多 专用 软件 (如 Amos, EQS, 
LISREL 和 Mplus)， 但 传统 软件 也 有 一 些 局 限 ， 且 
很 多 新 提出 的 前 沿 方法 尚 不 能 很 快 纳 入 传统 软件 
中 。 此 时 ， 研 究 者 自己 开发 的 软件 包 就 对 改进 传 
统 软件 局 限 和 推动 新 方法 应 用 起 到 重要 作用 。 有 
不 少 方法 文献 致力 于 介绍 新 开发 的 SEM 软件 包 。 
例如 , Gonzales (2021), Rosseel (2012), Igolkina 和 
Meshcheryakov (2020) 分 别 介绍 了 综合 性 的 SEM 
软件 包 JMP Pro、lavaan 和 semopy, Jiang 等 (2017) 
介绍 了 等 效 性 检验 软件 包 equaltestMI, Zhang 等 
(2021) 介 绍 了 CFA 模型 修正 软件 包 blcfa。 
8.3 ”结语 
对 于 SEM 的 前 沿 方 法 , 国内 期 刊 文献 的 工作 
大 多 数 属于 跟踪 、 介 绍 或 评论 、 整 合 , 缺乏 对 这 
些 方法 统计 学 性 质 的 深入 研究 。 一 方面 ， 对 方法 
之 间 的 联系 认识 不 够 。 少 有 研究 试图 厘清 竞争 方 
法 之 间 的 数理 关联 (如 : DRR 等 ,印刷 中 ; 温 涵 ， 
梁 竟 斯 ，2015)， 如 哪些 方法 是 近似 甚至 等 价 的 ， 
或 通过 怎样 的 变化 , 不 同方 法 可 以 相互 转化 。 而 
此 类 研究 在 国外 并 不 鲜 见 (Serang et al., 2019; 
Usami et al., 2015, 2019; Yuan & Deng, 2021)。 此 
类 分 析 有 助 于 加 深 研 究 者 对 方法 的 全 面 理解 和 融 
会 贯通 。 另 一 方面 ,方法 之 间 比 较 的 模拟 研究 也 
不 多 。 比 如 有 关 拟 合 指数 的 模拟 研究 国外 从 未 间 
W, 既 有 模拟 研究 探究 各 种 非 拟 合 因素 (如 参数 估 
计 方 法 和 信和 度 ) 对 拟 合 指数 估计 的 影响 (McNeish 
et al., 2018; Shi & Maydeu-Olivares, 2020), 也 有 
研究 比较 新 拟 合 指数 和 流行 拟 合 指数 的 优 劣 
(Counsell et al., 2020; Garnier-Villarreal & Jorgensen, 
2020)。 

REKATE, 过 去 20 年 国内 SEM 方法 成 
果 仍 为 提升 国内 量化 研究 水 平 提供 了 强大 助力 ， 
相信 在 方法 研究 和 应 用 需求 的 相互 促进 之 下 , 未 
来 会 有 更 多 高 质量 的 SEM 方法 文献 出 现 。 
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Abstract: In the first two decades of the 21st century, the hotspots of the methodological research on 


structural equation models (SEM) in China’s mainland generally involve the following five aspects: model 


development, parameter estimation, model evaluation, measurement invariance and special data processing. 


Remarkably, there is more progress in model development (i.e., different variations of SEM) amongst the 


above aspects. After an overview of the background knowledge of these hotspots, we presented the main 


research topics and methodological achievements under each hotspot. We also discussed the recent progress 


in SEM methodological research abroad and the future research directions. 
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